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Організація побудови просторів 
даних туристичної сфери 


У статті описано методи отримання, інтеграції та завантаження даних у сховищах даних туристичної 
сфери. Побудовано модель простору даних туристичної сфери. 


Вступ 


Останнім часом на розвиток туристичного бізнесу великий вплив мають Інтер- 
нет-технології 1 все частіше у всесвітній павутині можна знайти різноманітні сайти 
(сторінки), присвячені розвитку туристичної індустрії, туристичним фірмам, агентствам, 
а також санаторіям, пансіонатам, базам відпочинку та готелям. 

Найбільш ефективно використовують переваги Інтернету туристичні фірми та 
агентства для реклами та надання туристичних послуг. Тому не дивно, що саме продаж 
туристичних послуг (продаж турів, бронювання авіабілетів, готелів тощо) знаходить- 
ся в першій п'ятірці за об'ємами продажу в Інтернеті. 

Щодо України, то наразі тут туристичні фірми найбільш активно використо- 
вують Інтернет як альтернативний рекламний засіб для своїх послуг. Причинами такої 
ситуації є розрізненість та неузгодженість даних між туристичними агентствами, ор- 
ганами управління та органами соціальних досліджень, використання різних систем 
збереження таких даних, відсутність єдиних методів їх інтеграції та опрацювання. 

Розроблені на сьогодні підходи до інтеграції даних за своєю функціональністю 
поділяються на два типи: інтеграції веб-застосувань та інтеграції на основі сховищ 
даних (з утворенням локального сховища даних). Проте специфіка сфери туризму, а 
саме: 

- наявність великої кількості джерел даних, інформація у яких є різною структурою, 
не виключає протиріччя та суперечливості інформації; 

- наявність великої кількості моделей зберігання джерел даних (реляційні бази даних 
(РБД), сховища даних (СД), структуровані текстові файли, електронні таблиці, статич- 
ні та динамічні веб-сайти тощо); 

- відсутність стандартів найменування об'єктів та суб'єктів туристичної галузі; 

- ієрархічне впорядкування об'єктів туристичної галузі та агрегування інформації у 
ході передачі її до верхніх рівнів ієрархії, 

вказує на те, що для врахування інформації, отриманої від усіх об'єктів туристичної 
галузі, необхідно поєднати обидва типи інтеграції. 

Можливість об'єднання обох типів інтеграцій дає нова методика зберігання та 
опрацювання даних - простір даних. Перші роботи з просторів даних з'явилися у 
2005 р. (М. ЕгапКіп, А. Наїеуу, Р. Маїег, В. Коз5тапи, ).-Р. Дтиісі). На сьогодні ці ро- 
боти мають описовий характер та вказують лише на проблеми, які повинен вирішити 
простір даних. 
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Концепція простору даних (ПД) припускає, що учасники простору - зовнішні 
за відношенням до системи обробки даних, адміністративно-розподілені і семантично 
гетерогенні джерела даних, - можуть співіснувати з деякою необхідною мірою зв'я- 
зності: від простого переліку цих джерел до серйозної БД, що об'єднує їх відповідно 
до деякої схеми. При цьому концепція ПД передбачає можливість моделювати будь- 
який вид зв'язку між учасниками. 

Об'єктом дослідження є суб'єкти та об'єкти туристичної сфери, зв'язки між ни- 
ми та інформація, якою вони обмінюються. 


1. Актуальність роботи 


Простір даних ЮВ5 - це множина даних, поданих у різних моделях (баз даних ДВ, 
сховищ даних РУУ, статичних веб-сторінок УУБ, неструктурованих даних МА, графічних 
та мультимедійних даних Ст), локальних сховищ та індексів (ОДУУ), а також засобів 
інтеграції (б), пошуку (5е) та опрацювання інформації (УУо), об'єднаних середови- 
щем управління моделями (ЕМ) |21: 

р5 - « рВ, РУУ, ОРУУ, УУЬ, Ха, Сг, і, 5е, У/о, ЕМ ». 

У сучасному світі, що прагне до глобалізації відносин, період між надходжен- 
ням даних і ухваленням рішення неухильно скорочується. Усе більше процесів вимагає 
аналізу в режимі реального часу, коли будь-яка затримка є критичною. І в таких си- 
туаціях без допомоги ефективного інструментарію обробки даних, побудованого на 
інформаційних технологіях, туристичному операторові не обійтися. 

Простір даних дозволяє туристичному операторові самостійно розподіляти свої 
тимчасові ресурси. З використанням процедур з'являється можливість багаторазово 
використовувати власну працю, яку затрачено на пошук рішення в аналогічній си- 
туації, узагальнювати Й аналізувати власний досвід, обмінюватися ним з іншими ту- 
ристичними організаціями. У підсумку повинна з'являтися можливість заощаджувати 
час туристичних операцій, які затрачено на прийняття складних рішень з більшим 
числом невідомих. А для цього нам потрібні механізми структурування, агрегування, 
ефективного пошуку й аналізу даних, які й повинен надавати простір даних. 


2. Постановка задачі 


Опишемо об'єкти туристичної сфери, інформація з яких повинна опрацьовуватися 
іншими об'єктами туристичної сфери: 

Місцеві органи управління - надають інформацію про відпочинкові, рекреаційні 
та оздоровчі ресурси, а також правила їх експлуатації; шляхи сполучення, особливості 
місцевості тощо. 

Туристичні агентства -- надають інформацію про себе, про свої послуги. 

Адміністративні одиниці - описуються через інформацію місцевих органів уп- 
равління, а також через відгуки попередніх відвідувачів. 

Особа (відпочивальник) -- надає інформацію про себе, про умови, які він хоче 
отримати, ціни тощо. 

Залежно від типу об'єкта інформація може зберігатися у різних моделях та над- 
ходити з різних джерел. 

Туристичне агентство - база даних, динамічний веб-сайт з базою даних, розмі- 
щеною на веб-сервері. 

Адміністративна одиниця - сховище даних. 
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Особа - веб-сайт, база даних, текстові дані тощо. 
Відпочинковий ресурс - база даних, веб-сайт. 
Об'єкти туристичної галузі та задачі, що перед ними ставляться, подані на рис. І. 


База даних 
органів 
управління Застосування 
Бази даних - оон 
комбінатів Задачі туристичної о 
харчування галузі 
Моніторинг подій 
Бази даних Побудова каталогу 
готелів, мотелів, простору даних Бази даних 
чарів р ру д 
МенеконІВ Побудова локального туристичних 
Веб-вузол сховища даних агенств 
електронної 
комерції Трансформування Бази даних 
організацій 
Сховище даних Пересилання зеленого 
міністерства з повідомлень, туризму 
туризм | перемішення ланих | 
уризу Бази даних 
Веб-системи Пошук і запити організацій з 
пошуку проведення 
інформації екскурсій 


Рисунок 1 - Об'єкти туристичної сфери та задачі, що перед ними ставляться 


Розглянемо сфери застосування інформаційних технологій у туристичній галузі. 
Вони подані на рис. 2. 

Більшість користувачів туристичної сфери у своїй роботі використовують досить 
обмежені набори даних, які варіюються залежно від типу діяльності. У принципі для 


ефективної організації власного простору туристична організація повинна мати мож- 
ливості, подані на рис. 3. 


Сфери застосування інформаційних технологій в туристичному бізнесі 
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У», спеціалізованого не бронювання на 
електронний Борна формування і і 
б програмного забезпечення рен МуУебчсайті 
документообіг | Мова: каталогів, - 
- | - для розрахунку цін формування підприємства, 
Ні - « ге 
управання туроператорів та управління днажанаююі участь у 
проектами завантаженням рейсів | май міжнародних 
ранні неви простору даних. Ародни: 
відкриття рахунків в ; системах Інтернет- 
Тнтернет-гротшах бронювання 


Рисунок 2 - Сфери застосування інформаційних технологій в туристичному бізнесі 
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Вибір джерела даних 
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Задання критеріїв відбору даних із 
джерел за різними критеріями 


і 


Зберігання відібраних даних у 
власних базах даних 


Переглядання, редагування й 
перетворювання даних за 
допомогою різних механізмів 
роботи з даними 


Зберігання сценаріїв обробки 
даних для наступного 
використання 


і 


Обмін даними з іншими відділами 
або організаціями 


Рисунок 3 - Схема організації власного простору для туристичної організації 


Розглянемо ці можливості більш докладно. 

1. Вибір джерел даних. 

Дані можуть вибиратися з будь-яких доступних джерел. Це може бути Інтернет, 
файлові джерела (локальні й мережні), структуровані бази даних 1 т.д. При цьому 
можна брати не все джерело, а тільки його частину, попередньо обмежуючи масив 
доступних для відбору даних (наприклад, не весь локальний диск, а тільки папку, не 
весь Інтернет, а тільки певний сайт, не всю базу даних, а тільки певну таблицю). 

2. Відбір даних із джерел. 

Для відбору даних у першу чергу потрібен потужний 1 функціональний меха- 
нізм пошуку. Користувач повинен мати можливість відбирати все, що завгодно, як за 
ключовими словами, так і за допомогою різних засобів інтелектуального пошуку. 

3. Збереження результатів відбору. 

Відібрані дані необхідно зберегти, причому вже на цьому етапі користувач по- 
винен мати можливість провести попередню структуризацію отриманих даних. Для 
цього користувачеві надається можливість створювати структуровані набори - бази 
даних, за допомогою яких, відповідно до своїх запитів, він може задавати структуру да- 
них, що зберігаються. За бажанням користувача бази даних можуть бути певним чи- 
ном проіндексовані - для спрощення подальшої роботи з ними. 

4. Робота з даними. 

Збережені дані потрібно опрацювати. Для цього необхідно мати повний набір 
можливостей для роботи з даними, включаючи пошук, перегляд, редагування й пере- 
творення. Працювати можна як з окремими елементами бази даних, так і з самими 
базами даних, застосовуючи до них різні операції перетворення, пов'язані з обчислен- 
нями, об'єднаннями, порівняннями й т.п. Перетворені бази даних також зберігаються. 
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5. Збереження сценаріїв. 

Вся зроблена робота зі знаходження рішення повинна зберігатися у вигляді 
процедури, за допомогою якої в майбутньому можна проаналізувати виконану роботу. 
Процедури дозволять згодом прийняти рішення під час пошуку можливих альтерна- 
тив, узагальнити результати, використати для рішення аналогічних завдань. 

6. Обмін даними. 

Для обміну даними повинні використовуватися різні механізми, наприклад, архі- 
вування та передача мережами, вивантаження в зовнішній формат, публікація тощо. 


3. Основний матеріал 


У просторі даних повинна використовуватися вся інформація, що потрібна для 
конкретної туристичної організації, незважаючи на формат і місце розташування цієї 
інформації, а також повинен моделюватися розвинутий набір зв'язків між репозита- 
ріями даних. Тому на логічному рівні простір даних представляється як набір учасників 1 
зв'язків. Разом з неоднорідністю вмісту простору даних виникає потреба в підтримці 
декількох стилів доступу до даних. ПИПД допускає багато різних режимів взаємодії, 
і потрібна гранична спільність, щоб допустити застосування різних служб до різних 
типів вмісту. 

Архітектуру простору даних розділимо за рівнями (рис. 4). 


Каталог 
учасників 


Каталог 
простору 


Віртуальний рівень 
(рівень онтології 


Рисунок 4 - Рівні реалізації простору даних 


Базовою службою простору даних є каталогізація елементів даних, отриманих 
від учасників. Каталог - це реєстр ресурсів даних, що утримує найбільш загальну 
інформацію про кожний з них: джерело, ім'я, місце розташування в джерелі, розмір, 
дата створення й власник і т.д. Каталог є інфраструктурою для більшості інших 
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сервісів просторів даних, але він також може підтримувати базовий користувацький 
інтерфейс перегляду простору даних: 
Месадаста ОВ, РрУУ, УуУь, Ма, Сг) -ь Со. 

Він не тільки містить описову інформацію (тобто виконує роль метаданих), але 
й зберігає для кожного учасника схему джерела, статистичні дані, швидкість зміни, 
точність, можливості відповідей на запити, інформацію про власника і дані про полі- 
тику доступу 1 підтримку конфіденційності. Оскільки джерела простору даних фізично 
не переносять у нього інформацію та можуть обмінюватись між собою інформацією, 
то у каталозі необхідно зберігати дані 1 про зв'язки між джерелами. 

Зв'язки у каталозі можуть зберігатися у вигляді: 

- метаданих; 

- перетворень запитів; 

- графів залежності; 

- текстових описів тощо. 

Призначення каталогу можна охарактеризувати таким чином: 

- визначення семантично близьких назв об'єктів. Прикладом може бути У/огаМеї. 
Це велика семантична лексична база даних англомовних термінів, синонімів, прий- 
нятих скорочень, зв'язків між синонімами; 

-- визначення користувачів та їх прав доступу (привілеїв); 

- визначення джерел даних, структур даних та зв'язків між ними. 

Двома основними службами, які будуть підтримуватися в ПИПД, є пошук і за- 
пити даних. Пошук є основним механізмом роботи кінцевих користувачів з більшими 
колекціями незнайомих даних. Пошук менш вимогливий, ніж запити даних, оскільки 
він заснований на подібності, наданні кінцевим користувачам ранжованих результатів 
і підтримці інтерактивного вдосконалювання. ПІД повинні дозволяти користувачам 
задавати пошуковий запит й ітераційно його вдосконалювати, якщо це доречно, до 
вигляду запиту в стилі бази даних. Ключовий принцип просторів даних полягає в 
тому, що пошук повинен бути застосовуваним до всього вмісту простору даних, не- 
залежно від форматів даних. Універсальні можливості пошуку й запитів повинні по- 
ширюватися на метадані. У користувачів повинні бути можливості знаходження 
необхідних джерел даних і одержання інформації про їхню складність, коректність 1 
актуальність. 


Відповідно до перерахованих служб, виділяються наступні архітектурні компо- 
ненти ППИПД. 
еструкту- СЗапит) 
ровані 
зов дані 
- Локальне о 
чн І М - зберігання й ПМ" У 
Ю аталог і індексування 
Туристичний перегляд нексу 
оператор 
ен Аналітик 
"пошук 2 


Дані Простір даних 


Рисунок 5 - Архітектура простору даних 
Каталог і перегляд. Каталог містить інформацію про всіх учасників простору 


даних і про зв'язки між ними. Для кожного учасника каталог повинен включати схе- 
му джерела, статистичні дані, швидкість зміни, точність, можливості відповідей на 
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запити, інформацію про власника й дані про політику доступу й підтримку конфі- 
денційності. Зв'язки можуть зберігатися у вигляді перетворень запитів, графів залежності, 
а іноді навіть у вигляді текстових описів. 

По можливості в каталозі повинен міститися базовий реєстр елементів даних по 
кожному учаснику: ідентифікатор, тип, дата створення й т.д. Тоді в ньому можна під- 
тримувати базову можливість перегляду об'єднаного реєстру всіх учасників. Інтерфейс 
перегляду можна використати для відповідей на питання користувачів про наявність 
або відсутність елемента даних або визначення того, які учасники зберігають доку- 
менти даного типу. 

Навколо каталогу ПИПД повинне підтримуватися середовище керування моде- 
лями, що дозволяє створювати нові зв'язки й маніпулювати існуючими зв'язками 
(наприклад, поєднувати або інвертувати відображення, зливати схеми й створювати 
єдині подання декількох джерел). 

Пошук і запити. У користувачів повинна бути можливість запиту будь-якого еле- 
менту даних, незалежно від його формату й моделі даних. 

Щодо носіїв простору даних виконуються такі операції з множини 5е: 

1. Запит про довільні дані 58 іє - У КОристувачів повинна бути можливість 


запиту будь-якого елементу даних, незалежно від його формату і моделі даних. 
Здійснюється на основі ключових слів Кеу ууога та каталогу даних СЄ. Спочатку 
ПППД повинні підтримувати для кожного учасника запити за ключовими словами. 
У міру того, як ми одержимо більше інформації про учасника, ми повинні поступово 
почати підтримувати складніші запити. Система повинна підтримувати плавне переми- 
кання між запитами за ключовими словами, переглядом і структурованими запитами. 
Зокрема, при видачі відповідей на запит за ключовими словами (або на структурова- 
ний запит) повинні пропонуватися додаткові інтерфейси запитів, що дозволяють корис- 
тувачу удосконалити свій запит: 


Зе 


2. Стуктуровані запити будуються з використанням 50ОЇ. та подібних мов. За 
допомогою каталогу визначається, чи джерело, у якому здійснюватиметься пошук, 
містить структуровану інформацію. Якщо це так, то виконується запит безпосередньо 
до джерела даних. В іншому випадку запит продовжує виконуватись за каталогом 
даних у вигляді пошуку ключових слів. Запити в стилі баз даних повинні підтриму- 
ватися на основі загальних інтерфейсів (тобто схем-посередників), що забезпечують 
доступ до декількох джерел, або вони можуть адресуватися конкретному джерелу 
даних (з використанням його власної схеми) з наміром отримання відповідей і від 
інших джерел (як в системах керування одноранговими даними - Реег-Дага Мапаєе- 
тепі Зузіет) (3). Запити можуть формулюватися на різноманітних мовах (1 на основі 
різних моделей даних), і вони повинні, якщо можливо, найкращим чином перефор- 
мулюватися на інші моделі даних і схеми, забезпечуючи точні і приблизні семантичні 
відображення: 


5ішаріє : СО еу - мона (Се). 


Зе 


3. Запити до метаданих повинні забезпечувати можливості: 
- отримання даних про джерело відповіді та місцезнаходження джерела; 
-- визначення елементів даних в просторі даних, що можуть залежати від заданого 
елементу даних, і підтримка гіпотетичних запитів; 
- визначення рівня невірогідності відповіді. 


(Сі но (сг) С (З0ИГСе), 


5їгистигеї 
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Організація побудови просторів даних туристичної сфери УТ 


Схема пошуку інформації за запитом подана на рис. 6. 


1. Запит за ключовими словами 
2. Запит за формою 
. ЗО, Х-Оиегу тощо 


Позиціонування 
запиту 


1. Джерело даних, його опис та мова 


Вибір учасників запиту 
створення Перегляд 2. Джерело даних, його опис та мова 
Н результатів Зенй 
підпростору пту 
3. Джерело даних, його опис та мова 
запиту 


п. Джерело даних, його опис та мова 
запиту 


Ранжування списку 
джерел даних 


Рисунок 6 - Схема пошуку інформації у просторі даних 


Локальне зберігання й індексування. У ПІД повинен бути компонент збері- 
гання й індексування, що забезпечує наступні можливості: створення запитуваних 
асоціацій між об'єктами даних, отриманих від різних учасників; удосконалювання 
доступу до джерел з обмеженими власними засобами доступу; можливість виконання 
деяких запитів без доступу до реального джерела даних; підтримку високого рівня 
доступності й відновлення. 

Засоби індексування повинні мати високий рівень адаптивності до неоднорідних 
середовищ, Для вхідних даних необхідно, щоб приймалося будь-яке елементарне зна- 
чення, що зустрічається в просторі даних, і повинні видаватися координати всіх 
об'єктів даних, у яких є таке значення, і ролі кожного його входження. Важливими 
аспектами індексу є те, що, по-перше, він визначає інформацію для всіх учасників, 
коли деякі значення входять у кілька джерел даних. По-друге, індекс повинен справ- 
лятися з різнорідністю посилань на об'єкти бази. 

Компонент розкриття. Призначення цього компонента полягає у виявленні 
учасників у просторі даних, створенні зв'язків між ними й наданні допомоги адмініст- 
раторам при вдосконалюванні й посиленні цих зв'язків. Виявлення учасників може 
відбуватися в декількох формах, наприклад, у формі обходу довідкової структури, 
починаючи від кореня, або у формі пошуку координат всіх баз даних у корпоративній 
мережі. Компонент повинен виконувати початкову класифікацію учасників на основі 
їхніх типів і вмісту. 

Після розкриття учасників система повинна забезпечити середовище для напів- 
автоматичного створення зв'язків між учасниками й удосконалювання та підтримки 
існуючих зв'язків. Цей процес включає знаходження пар учасників, які, ймовірно, 
повинні бути зв'язані один з одним, і пропозицій зв'язків, які потім перевіряються та 
уточнюються людиною. Компонент розкриття повинен здійснювати моніторинг умісту 
простору даних, щоб можна було згодом запропонувати нові зв'язки. 

Компонент розширення джерел. У деяких учасників можуть бути відсутні іс- 
тотні функції керування даними. У ПИПД повинні бути засоби наповнення такого 
учасника додатковими можливостями, такими, як схема, каталог, пошук за ключови- 


«Штучний інтелект» 272009 89 


Шаховська Н.Б., Угрин Д.І. 
2 Ш 5000 -  Т НИо  ЛЕ 


ми словами й моніторинг відновлень. Може виявитися необхідність забезпечувати ці 
розширення за відділеннями чи напрямками, оскільки можуть бути реальні додатки 
або потоки даних, розраховані на наявні формати або довідкові структури. 


Висновки 


У статті описано простір даних туристичної сфери, що забезпечує взаємодію 
між джерелами інформації, поданої за допомогою різних моделей даних, з різними 
методами подання та опрацювання. Наукова новизна полягає в уведенні формального 
опису простору даних та окреслення його основних задач. Практична цінність полягає 
у побудові простору даних туристичної сфери, виділенні основних об'єктів та учас- 
ників. Подальші дослідження стосуватимуться формалізації методів інтеграції даних 
та пошуку неструктурованих, напівструктурованих та строго структурованих даних. 
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Н.Б. Шаховская, Д.Й. Угрин 

Организация построения пространств данньтгх туристической сферьт 

В статье описань методьт получения, интеграции и загрузки данньтх в хранилищах данньх туристической 
сферьх. Построена модель пространства данньх туристической сферь. 


М.В. 5НаПоузка, Д.І. Сотуп 
Ап огадег, плеїродя апа Гасійне5 ої бейіпе, сопсогдапсе, іпіертайоп об іпіогтайоп, сгеайоп ої орегайїує Феровіїогіе5 


об іпбогалайоп апа Їоад ої іпіогтлайоп, 15 іп-ргосе55 угогКей оці їп а сепіга! дерозіїогу. ТВре дагазразе плоді 
і бий. ТЬе плат ргобіетея ої гопгізт 5ріеге аге дезсгібеа. 
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